實現更智慧的數位預失真引擎:一種基於神經網絡的方法

作者:ADI首席工程師暨終端市場專家 Hamed M. Sanogo


問題:

在基於神經網路的數位預失真(DPD)模型中,使用不同的啟動函數對整個系統性能和能效有何影響?

Toward Smarter Digital Predistortion Engines: A Neural Network-Based Approach

答案:

類似整流線性單元(ReLU)這類計算高效的啟動函數由於能降低能耗,因此更適合行動裝置和物聯網裝置等資源受限的環境。相較之下,諸如 sigmoid 和 tanh 等更複雜的函數,儘管在某些場景下能帶來更優的性能,但由於運算需求更高,可能會增加能耗。因此,在數位預失真(DPD)模型中選擇啟動函數時,需同時兼顧性能和能效,以根據目標應用優化系統。

摘要

為了解決下一代無線通訊中功率放大器(PA)的訊號失真和效率低下的難題,本文提出了一種AI驅動的數位預失真(DPD)框架。基於多項式的傳統DPD方法存在計算複雜性問題,而且對非線性和記憶效應的適應能力有限。本文提出的系統利用了先進的神經網絡架構動態優化預失真,在效率、適應性和即時校正等方面均優於傳統方法。儘管存在模型可解釋性和能耗等挑戰,基於此框架打造的可擴展、高效率的解決方案依然代表了現代通訊網路射頻發射器設計的一項重大進步。

簡介

OpenAI於2022年11月推出的ChatGPT,是史上使用者增長速度最快的軟體產品之一,充分展現了人工智慧(AI)的高度潛力。機器學習(ML)是AI的一個分支,能夠促進電腦執行決策和資料分析等任務,深刻改變了各行各業。在通訊領域,數位預失真(DPD)技術在AI和ML的推動下不斷發展,這項技術對於減少訊號失真和提升功率放大器(PA)的效率非常重要。傳統DPD模型難以處理5G等現代通訊系統中存在的非線性特性和記憶效應。這些傳統模型假定PA的行為是靜態且無記憶的,因此透過多項式來描述輸入輸出之間的暫態關係。然而,AI和ML擅長學習複雜模式,因此能夠提供更精準的解決方案。本文提出了一種基於人工神經網絡的DPD框架,利用PA資料來降低增益/相位誤差、提升效率並改善頻譜性能,其效果優於傳統方法。

提升PA效率:數位預失真技術融合AI創新

數位預失真是一項關鍵技術,其使功率放大器能夠在飽和區附近高效工作,同時不損害線性度。DPD透過擴展PA的線性工作範圍,讓射頻(RF)設計人員能夠充分利用非線性PA的效率優勢,同時保持發射訊號的線性度,滿足正交頻分複用(OFDM)等複雜調變方案的需求。

DPD的基本原理是預失真係數的引入。預失真係數是基於對PA的逆向幅度到幅度(AM-to-AM)和幅度到相位(AM-to-PM)的特性進行建模而得出的。在此過程中,精準的消除鉅齒被引入輸入波形中,進而有效補償PA的非線性。因此,DPD不僅能改善訊號品質,而且讓PA能夠以峰值效率工作。關於DPD演算法及ADI的 ADRV9040RF收發器如何為DPD的設計和實現提供精簡硬體平台的詳細內容,請參閱「簡化5G基地台發射器配置、設計和評估」一文。圖1展示了利用DPD使PA回應線性化的原理。

Figure 1. Generic concept of DPD for linearizing the PA response: (a) typical AM-to-AM curve showing the overall linear region is in green; (b) basic concept of DPD and how it improves power amplifier efficiency.
圖1.利用DPD使PA回應線性化的原理:(a)整體線性區域的典型AM到AM曲線(綠色);(b)DPD的基本概念以及其如何提升功率放大器的效率。

功率放大器在接近飽和時會表現出非線性,進而導致訊號失真、頻譜再生和效率降低,這在具有I/Q不平衡和記憶效應等缺陷的高頻寬系統中尤其顯著。AI和ML,尤其是神經網絡(NN),能夠對PA失真進行建模並動態優化預失真,進而帶來顛覆性的改進。這種AI驅動的方法提升了系統的效率和適應性,優於傳統方法,同時在性能和計算複雜性之間取得了平衡。

利用神經網絡模型優化DPD引擎:一個顛覆性框架的提出

人工神經網絡是人工智慧的基石,尤其是在深度學習領域。神經網絡的設計初衷是為了克服傳統機器學習演算法的侷限性。受人類大腦處理資訊能力的啟發,神經網絡擅長模式識別、學習和決策,因此非常適合解決複雜的非線性問題。例如,在5G LTE系統中,利用基於神經網絡的DPD方法可以有效解決I/Q不平衡、相移、DC偏移、串擾和PA非線性等難題。

基於多項式的DPD方案依賴於對系統機制的深入理解,且難以擴展;相較之下,神經網絡模型擅長以較少的約束條件處理複雜的非線性行為。本節文章提出一種NN DPD框架,以減輕非線性和發射器缺陷的影響。過程中涉及三個關鍵步驟:測試PA特性並收集大量資料、訓練後失真神經網絡模型、部署模型並進行性能監控和調整。此方法透過機器學習將大型資料集轉化為可實踐的操作,從而為因應現代通訊挑戰提供穩健、可擴展的解決方案。

第1步:收集PA特性資料

為了設計和實現用於優化無線功率放大器的AI/ML模型,收集全面、高品質的特性資料非常重要,這些資料應當準確反映PA在不同條件下的實際性能。圖2顯示了一種可用於PA特性資料收集的示例配置。

Figure 2. Measurement setup for wideband PA characterization.
圖2.用於寬頻PA特性分析的測量配置。

透過圖2所示的測試平臺可以全面分析元件特性,擷取S參數、輸出功率、功率附加效率(PAE)、輸入阻抗、輸入回波損耗、功率增益、AM到PM轉換等其他參數。表1詳細列出了模型所需的所有輸入資料。但需要注意的是,模型的維數會影響其回應時間。此外,採集的資料必須先數位化,然後才能用於訓練過程。

表1.測量專案及其描述
項目 描述和詳細資訊
小訊號特性 使用向量網路分析儀在所需的頻率範圍和不同的偏置條件下測量S參數,收集小訊號特性。透過這些參數,可以瞭解輸入/輸出匹配和PA的頻率響應。
非線性特性和大訊號資料 收集大訊號工作時的非線性特性測量結果,包括收集關於輸入輸出功率關係(PIN與POUT)、功率附加效率和增益壓縮點(如P1dB)的資料。採集AM到AM和AM到PM失真資料對於瞭解PA在高功率水準下的行為特別有價值。
效率指標 收集效率資料(包括各種負載條件下測量的漏極效率和整體效率、輸入功率、頻率)和工作溫度。
線性度和訊號完整性 收集線性度指標,例如鄰通道功率比(ACPR)、誤差向量幅度(EVM)和交調失真(IMD)。
熱性能 收集利用溫度感測器獲得的熱性能資料。透過這些資料,可以瞭解不同功率水準和環境條件下的散熱情況和PA的可靠性。
環境資料和老化資料 收集環境條件資料(如溫度和濕度變化)和關於老化測試的資料,有助於預測長期性能和可靠性。
雜訊特性 雜訊性能透過雜訊係數和相位雜訊頻譜等指標來衡量,可提供關於訊號完整性的重要資訊。

這種嚴格而系統的資料收集方法為開發能夠精準預測和優化PA性能的AI/ML模型奠定了基礎。借助此種全面的資料集,設計人員可以實現可靠、高效的無線通訊系統。

第2步:訓練模型

模型訓練過程包括將表1中收集的(部分或全部)訊號輸入到系統中,並透過損失函數來優化DPD模型以使誤差最小化。神經網絡架構由相互連接的節點層(例如人工神經元)組成,即圖3所示的組成部分。

Figure 3. Architecture of a multiclass prediction neural network in deep learning.
圖3.深度學習中的多類別預測神經網絡架構。
表2.神經網絡核心組成部分和描述
核心組成部分 描述和詳細資訊
輸入層 輸入I/Q分量用 IIN(n)和QIN(n)來表示,代表了模型的最低輸入要求。 表1列出了其他獨立變數,例如PIN/POUT資料、AM到AM、AM到PM測量值。雖然可以利用表1中列出的所有輸入變數來訓練神經網絡的DPD模型,但納入更多的因變數會增加模型的維數和計算量。更高的複雜度會導致需要訓練更多的權重和偏置,使得訓練和推理時間延長,並需要更大的記憶體來儲存模型和處理中間運算。
隱藏層 介於輸入層和輸出層之間的層。每個神經元接收來自上一層的輸入,進行加權求和運算,加上一個偏置項,然後將結果傳遞給啟動函數進行處理。ML工程師可以嘗試不同的啟動函數,根據環境和結果選擇最合適的啟動函數。
輸出層 神經網絡的最後一層,提供神經網絡所做的預測。輸出層將隱藏層學習到的進階特徵轉化為有意義的預測值。圖2展示了一個多類別場景,輸出層包含由兩個神經元組成的兩個節點,採用線性啟動函數將輸出映射為權重和係數,供圖4所示的DPD執行器模組使用。這些輸出可以被直接使用,或被進一步處理。
權重 權重表示相鄰層中兩個神經元之間連接的相關度或重要性。權重決定了一層中某個神經元的輸出對下一層中某個神經元的輸入有多大影響。
偏置 偏置是一個增加到神經元的輸入加權和的附加參數。偏置項透過平移啟動函數,使神經網絡能夠類比更複雜的關係。
啟動函數 啟動函數為模型引入非線性,使模型能夠學習和表示資料中的複雜模式和關係。常見的啟動函數包括ReLU(修正線性單元)、sigmoid、tanh和softmax。

在訓練期間,隱藏層使資料前向傳播,而權重和偏置通過反向傳播和梯度下降演算法進行優化。神經網絡結構可進行調整,以包含更多神經元(適用於高度非線性的分量)或更少神經元(適用於較平滑的元素)。

關於哪些AI硬體、軟體和工具最適合用來創建高效、可擴展的AI模型訓練環境,本文不作深入探討,但我們建議AI工程師可以嘗試一下KNIME,這是一個用於資料分析和機器學習的無代碼平臺。KNIME具有圖形化使用者介面(GUI),用戶只需拖放節點即可設計工作流程,無需掌握大量編程知識。所設計的工作流程非常直覺且易於理解,因此適合廣大用戶使用。對於更傾向於使用Python進行開發的人來說,Keras與TensorFlow®的結合能帶來顯著優勢,將Keras的簡單易用性與TensorFlow的穩健性和可擴展性相融合,是實驗級或生產級深度學習應用等各類項目的理想選擇。

PA特性分析工作涉及到百萬級樣本的收集,其中70%用於訓練,30%用於測試和驗證,以評估模型類比PA行為的能力。模型性能透過準確率、精度、召回率、F1分數和ROC-AUC等指標來評估。

第3步:驗證和部署神經網絡模型

部署過程從模型的驗證開始,以確保模型的穩健性和精準性。驗證集用於監控訓練品質並決定何時停止訓練,測試集則用於獨立評估模型的準確性和泛化能力。解決過擬合和欠擬合問題,對於確保模型在新資料集上的表現非常重要。為抑制過擬合、提升模型的泛化能力,可採用以下方法:精簡模型架構,限制神經網絡層數、隱藏神經元數量或參數規模;擴充訓練資料集規模;或進行裁剪,例如剔除對模型性能影響微弱的安全被用神經元。另一方面,為抑制欠擬合,可以增加隱藏神經元以提升模型的複雜性,或調整學習率、批量大小、正則化強度等超參數以改善性能。ML工程師必須平衡上述種種策略,並反覆運算評估DPD模型的性能,進而實現穩健且可泛化的模型,同時保證模型的執行速度。圖4顯示了神經網絡DPD模型評估系統架構的總體框圖。

Figure 4. A block diagram of the neural network DPD model evaluation platform.
圖4.神經網絡DPD模型評估平臺的框圖。

在任何情況下,要確定隱藏神經元的最佳數量,必須依靠實證研究、反覆試錯或在訓練過程中採用自我調整方法。這些調整有助於確保神經網絡在複雜性和性能之間取得適當平衡,進而實現高效且有效的模型部署。在部署模型的過程中,採用邊緣AI嵌入式MCU,例如ADI的 MAX78000卷積神經網絡加速器晶片,可以簡化模型的部署。

AI/ML與DPD系統集成:挑戰與機遇

將人工智慧和機器學習融入DPD系統,可望大幅提升系統性能,但也帶來了一些現實挑戰。DPD系統需要低延遲和高處理速度,而這對於計算密集型ML模型來說很難實現。此外,為了在溫度波動、硬體老化等動態運行條件下保持最佳性能,必須採用即時學習或遷移學習等自我調整技術。

功耗是另一個關鍵考量因素。AI/ML模型(尤其是深度學習架構)往往比傳統DPD方法更耗電,因此不太適合對功耗敏感的環境。未來的實驗應該採用羽量級神經網絡,即標準神經網絡的優化版本。羽量級神經網絡在設計上減少了參數數量,降低了算力需求,並提高了記憶體利用效率,對於計算資源有限的應用特別有用,例如移動和物聯網(IoT)設備或其他資源受限的系統。

許多ML模型(尤其是深度神經網絡)缺乏可解釋性,進一步加劇了它們與DPD系統集成的複雜性。神經網絡模型將複雜的操作簡化為權重、偏置和啟動函數,工作過程並不透明,因此除錯和優化是相當困難的。

結語

大規模MIMO等5G技術要求更低的功耗和更高的精度,DPD系統必須不斷發展以因應新的複雜性。透過自我調整學習和混合建模等創新,AI/ML將為實現可擴展、高效節能的解決方案提供關鍵支援。神經網絡能夠類比複雜的非線性關係和記憶效應,無需明確的數學公式就能近似處理非線性函數,讓DPD系統設計得以簡化。

整合AI/ML有助於提升能效比,使PA能夠在更接近飽和的狀態下工作,同時利用非線性PA降低成本。雖然存在挑戰,但AI/ML驅動的系統在增強DPD系統的精度、適應性和可擴展性方面潛力極大。傳統多項式與AI/ML技術相互結合的混合方法能夠提供一種均衡的解決方案,既保留了經典模型的可解釋性,又融合了AI/ML的先進能力。在AI/ML的助力下,透過創新策略因應種種挑戰,可以推動DPD系統取得突破性進展,進而支援現代通訊技術的持續進步。